首页> 外文OA文献 >An integrated approach for automatic semantic structure extraction in document images
【2h】

An integrated approach for automatic semantic structure extraction in document images

机译:一种用于文档图像中自动语义结构提取的集成方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In this paper we present an integrated approach for semantic structure extraction in document images. Document images are initially processed to extract both their layout and logical structures on the base of geometrical and spatial information. Then, textual content of logical components is employed for automatic semantic labeling of layout structures. To support the whole process different machine learning techniques are applied. Experimental results on a set of biomedical multi-page documents are discussed and future directions are drawn.
机译:在本文中,我们提出了一种用于文档图像中语义结构提取的集成方法。首先对文档图像进行处理,以基于几何和空间信息提取其布局和逻辑结构。然后,将逻辑组件的文本内容用于布局结构的自动语义标记。为了支持整个过程,应用了不同的机器学习技术。讨论了一组生物医学多页文档的实验结果,并指出了未来的方向。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号